草庐IT

LLM 评估

全部标签

基于LangChain的LLM应用开发3——记忆

此情可待成追忆,只是当时已惘然。我们人类会有很多或美好或痛苦的回忆,有的回忆会渐渐模糊,有的回忆午夜梦醒,会浮上心头。然而现在的大语言模型都是没有记忆的,都是无状态的,大语言模型自身不会记住和你对话之间的历史消息。根本用不着“时时勤拂拭”,天然就是“本来无一物”。每一次的请求交互、api调用都是独立的,完全没有关联。那些聊天机器人看起来有记忆,是因为借助代码的帮助,提供历史消息作为和LLM对话的上下文。嗯,就跟我们大脑不太够用了,要拿小本本或者打开Obsidian/Notion/语雀……来查找一样。(你去拜访某些单位,还可以看到前台拿着一本已经翻到包浆的小本子来查电话。)所以,现在的大语言模型

1个token终结LLM数字编码难题!九大机构联合发布xVal:训练集没有的数字也能预测!

虽然大型语言模型(LLM)在文本分析和生成任务上的性能非常强大,但在面对包含数字的问题时,比如多位数乘法,由于模型内部缺乏统一且完善的数字分词机制,会导致LLM无法理解数字的语义,从而胡编乱造答案。目前LLM还没有广泛应用于科学领域数据分析的一大阻碍就是数字编码问题。最近,熨斗研究所(FlatironInstitute)、劳伦斯伯克利国家实验室、剑桥大学、纽约大学、普林斯顿大学等九个研究机构联合发布了一个全新的数字编码方案xVal,只需一个token即可对所有数字进行编码。论文链接:https://arxiv.org/pdf/2310.02989.pdfxVal通过将专用token([NUM]

PyTorch官方认可!斯坦福博士新作:长上下文LLM推理速度提八倍

这两天,FlashAttention团队推出了新作:一种给Transformer架构大模型推理加速的新方法,最高可提速8倍。该方法尤其造福于长上下文LLM,在64k长度的CodeLlama-34B上通过了验证。甚至得到了PyTorch官方认可:如果你之前有所关注,就会记得用FlashAttention给大模型加速效果真的很惊艳。不过它仅限于训练阶段。因此,这一新成果一出,就有网友表示:等推理加速等了好久,终于来了。据介绍,这个新方法也是在FlashAttention的基础之上衍生而出,主要思想也不复杂:用并行操作尽快加载Key和Value缓存,然后分别重新缩放再合并结果,最终获得推理速度上的大

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

近年来,大语言模型(LLM)及其底层的transformer架构已经成为了对话式AI的基石,并催生了广泛的消费级和企业应用程序。尽管有了长足的进步,但LLM使用的固定长度的上下文窗口极大地限制了对长对话或长文档推理的适用性。即使是使用最广泛的开源LLM,它们的最大输入长度只允许支持几十条消息回复或短文档推理。与此同时,受限于transformer架构的自注意力机构,简单地扩展transformer的上下文长度也会导致计算时间和内存成本成倍增加,这就使得全新的长上下文架构成为紧迫的研究课题。不过,即使我们能够克服上下文缩放的计算挑战,但最近的研究却表明,长上下文模型很难有效地利用额外的上下文。这

英伟达推出 Tensor RT-LLM,使大语言模型在搭载 RTX 的 PC 平台上运行速度提高四倍

10月18日消息,英伟达是硬件领域的生成型人工智能之王,该公司的GPU为微软、OpenAI等公司的数据中心提供动力,运行着BingChat、ChatGPT等人工智能服务。今天,英伟达宣布了一款新的软件工具,旨在提升大型语言模型(LLM)在本地WindowsPC上的性能。在一篇博客文章中,英伟达宣布了其TensorRT-LLM开源库,这个库之前是为数据中心发布的,现在也可以用于WindowsPC。最大的特点是,如果WindowsPC配备英伟达GeForceRTXGPU,TensorRT-LLM可以让LLM在WindowsPC上的运行速度提高四倍。英伟达在文章中介绍了TensorRT-LLM对开发

mysql - 评估数学表达式

我有一列类型是varchar,这个列的值是数学运算(只是加减运算)col------2+3+2+13+3-41+1-2.5有可能评估这个表达式吗?需要的结果是:col----------82-0.5 最佳答案 因为您不能在CREATEFUNCTION中使用EXECUTEIMMEDIATE或准备好的语句(这有助于使用简单的CONCAT("SELECT",expr,"FROMdual")),请参阅下面的解决方案,该解决方案使用实际计算数学表达式的函数(因为您的问题仅涉及简单的表达式+和-运算符)DELIMITER$$CREATEFUNC

如何根据PYSPARK中的另一列对表达式评估中有条件地替换列中的值?

importnumpyasnpdf=spark.createDataFrame([(1,1,None),(1,2,float(5)),(1,3,np.nan),(1,4,None),(0,5,float(10)),(1,6,float('nan')),(0,6,float('nan'))],('session',"timestamp1","id2"))+-------+----------+----+|session|timestamp1|id2|+-------+----------+----+|1|1|null||1|2|5.0||1|3|NaN||1|4|null||0|5|10.0||

解密Prompt系列17. LLM对齐方案再升级 WizardLM & BackTranslation & SELF-ALIGN

话接上文的指令微调的样本优化方案,上一章是通过多样性筛选和质量过滤,对样本量进行缩减,主打经济实惠。这一章是通过扩写,改写,以及回译等半监督样本挖掘方案对种子样本进行扩充,提高种子指令样本的多样性和复杂度,这里我们分别介绍Microsoft,Meta和IBM提出的三个方案。Microsoft:WizardLMWizardLM:EmpoweringLargeLanguageModelstoFollowComplexInstructionshttps://github.com/nlpxucan/WizardLM要点:使用prompt对种子指令样本进行多样化,复杂化改写可以有效提升模型效果wizar